最近在计算机视觉中的实验证明了纹理偏见,作为采用卷积神经网络(CNNS)模型的最高结果的主要原因,与早期作品相冲突,声称这些网络使用形状识别对象。据信,成本函数迫使CNN采取贪婪的方法,并为纹理等本地信息制定倾向,以提高准确性,从而无法探索任何全局统计数据。我们提出了一种新的直观架构,这是一种新的直观架构,灵感来自心理学中的特征整合理论,利用人类的可解释特征,如形状,纹理,边缘等。重构,并对图像进行分类。我们定义了新颖的指标,以使用注意图量化这些模式中存在的“抽象信息”的“相关性”。我们进一步介绍了一个正则化方法,该方法可确保形状,纹理等的每个模式在给定的任务中都会对其进行比例影响,因为它可以重建;并且,除了赋予这些CNN的解释性以实现对象识别的卓越性能之外,执行实验以表明所得到的精度和鲁棒性。
translated by 谷歌翻译